使用搜索引擎,就算是引用网页,机器还是可能犯错
![[Pasted image 20250729121746.png]]
![[Pasted image 20250729121813.png]]
这两篇文章中,都没有说李宏毅曾在 Google 工作过
WebGPT:使用搜寻引擎的 GPT
![[Pasted image 20250729130247.png]]
比如问它个问题:
![[Pasted image 20250729122447.png]]
如何训练机器进行搜索、点选、收藏这些动作的?
答案:请人类老师示范
![[Pasted image 20250729124026.png]]
记录人类老师的行为,拿这些人类老师的行为的记录样本输入给机器进行训练,这个就是督导式学习
还是那熟悉的配方……
![[Pasted image 20250729124239.png]]
使用工具都是文字接龙
![[Pasted image 20250728234224.png]]
想办法在没有人类示范的情况下生成资料
![[Pasted image 20250729131014.png]]
[QA(question)]”),并给一些范例![[Pasted image 20250729131535.png]]
分别输入带有特定格式的内容和不带特定格式的内容,看它接下来的输出正确答案几率有没有提升。如果有这说明这个特定格式的内容有效,就保留
结果证明了使用工具是很有效的,但模型参数太小它学不会调用工具:
![[Pasted image 20250729131759.png]]